from openai import OpenAI

# 连接本地 vLLM 服务
client = OpenAI(
    base_url="http://47.236.192.56:8000/v1",
    api_key="EMPTY"   # vLLM 不验证 key，可以随便填
)

# 调用对话接口
response = client.chat.completions.create(
    model="/root/autodl-tmp/data/merge_models",  # 或者你的模型名/路径
    messages=[
        {"role": "system", "content": "你是一个智能客服助手，名字叫远贝。"},
        {"role": "user", "content": "代付钱包账号和手机号是一样的吗？"}
    ],
    temperature=0.1,
    max_tokens=512
)

print("模型回复：", response.choices[0].message.content)
